Wang Haihua
🍈 🍉🍊 🍋 🍌
系统聚类法是聚类分析方法中最常用的一种方法。它的优点在于可以指出由粗到细的多种分类情况,典型的系统聚类结果可由一个聚类图展示出来。
例如
在平面上有 7 个点 $w_1,w_2,w_3,w_4,w_5,w_6,w_7$(左图),可以用聚类图(右图) 来表示聚类结果。
记 $\Omega=\left\{w_{1}, w_{2}, \cdots, w_{7}\right\}$,
聚类结果如下:当距离为 $f_5$时,分为一类 $$ G_{1}=\left\{w_{1}, w_{2}, w_{3}, w_{4}, w_{5}, w_{6}, w_{7}\right\} $$ 距离值为 $f_4$分为两类: $$ G_{1}=\left\{w_{1}, w_{2}, w_{3}\right\}, \quad G_{2}=\left\{w_{4}, w_{5}, w_{6}, w_{7}\right\} $$
距离值为$f_3$分为三类: $$ G_{1}=\left\{w_{1}, w_{2}, w_{3}\right\}, \quad G_{2}=\left\{w_{4}, w_{5}, w_{6}\right\}, \quad G_{3}=\left\{w_{7}\right\} $$
距离值为 $f_2$分为四类: $$ G_{1}=\left\{w_{1}, w_{2}, w_{3}\right\}, \quad G_{2}=\left\{w_{4}, w_{5}\right\}, \quad G_{3}=\left\{w_{6}\right\}, \quad G_{4}=\left\{w_{7}\right\} $$
距离值为 $f_1$分为六类: $$ G_{1}=\left\{w_{4}, w_{5}\right\}, G_{2}=\left\{w_{1}\right\}, G_{3}=\left\{w_{2}\right\}, G_{4}=\left\{w_{3}\right\}, G_{5}=\left\{w_{6}\right\}, G_{6}=\left\{w_{7}\right\} $$
距离小于 $f_1$分为七类,每一个点自成一类.
设$\Omega=\left\{w_{1}, w_{2}, \cdots, w_{7}\right\}$
(1)计算$n$ 个样本点两两之间的距离$\left\{d_{i j}\right\}$ ,记为矩阵$D=\left(d_{i j}\right)_{n \times n}$ ;
(2)首先构造$n$ 个类,每一个类中只包含一个样本点,每一类的平台高度均为零;
(3)合并距离最近的两类为新类,并且以这两类间的距离值作为聚类图中的平台高 度;
(4)计算新类与当前各类的距离,若类的个数已经等于 1,转入步骤 (5),否则,回到步骤 (3);
(5)画聚类图;
(6)决定类的个数和类。
如果使用最短距离法来测量类与类之间的距离,即称其为系统聚类法中的最短距离法(又称最近邻法),最长距离法同理。
参考资料